在本文中,我们考虑了两个当前流行的语义框架:抽象含义表示(AMR)是一个更抽象的框架和通用的概念认知注释(UCCA) - 一个锚固的框架。我们使用基于语料库的方法来构建两种图形重写系统,即一种确定性和非确定性的方法,从前者到后一个框架。我们介绍他们的评估以及在制定规则时发现的许多歧义。最后,我们提供了与比较不同口味的语义框架有关的讨论和一些未来的工作指导。
translated by 谷歌翻译
本文介绍了如何使用在线工具增长匹配来进行查询并可视化现有的语义注释的语料库中的数据。专用的语法可用于构造简单至复杂的查询,并针对语料库执行它们。此类查询给出了带注释的数据的横向视图,这些视图可以帮助检查一个语料库中或多个语料库中注释的一致性。然后可以将增长匹配视为错误挖掘工具:当检测到不一致时,它有助于找到应修复的句子。最后,Grow-Match还可以用作侧面工具,以协助注释任务,以帮助在现有语料库中与要注释的数据进行比较中的注释示例。
translated by 谷歌翻译
基于文本的对抗攻击变得越来越普遍,通用互联网用户可以访问。随着这些攻击的繁殖,解决模型鲁棒性中差距的需求即将变得迫在眉睫。在对抗数据上进行重新培训可能会提高性能,但这些模型在该模型中仍有一类其他角色级攻击。此外,重新培训模型的过程是时间和资源密集型,创造了对轻巧,可重复使用的防御的需求。在这项工作中,我们提出了对抗性文本标准器,这是一种新颖的方法,可恢复具有低计算开销的攻击内容上的基线性能。我们评估了标准级化合物在容易发生攻击的两个问题领域的功效,即仇恨言论和自然语言推断。我们发现,文本归一化提供了针对角色级攻击的任务不足的防御,该攻击可以对对抗性再培训解决方案进行补充,这更适合语义改变。
translated by 谷歌翻译
自从Covid-19大流行开始以来已有两年多之后,这场危机的压力继续在全球范围内摧毁。将胸部X射线(CXR)成像用作RT-PCR测试的互补筛查策略不仅盛行,而且由于其常规临床用于呼吸疾病,而且大大增加了。迄今为止,已经提出了许多基于CXR成像的COVID-19筛选的视觉感知模型。然而,这些模型的准确性和概括能力在很大程度上取决于培训的数据集的多样性和大小。在此激励的情况下,我们介绍了Covidx CXR-3,这是CXR图像的大规模基准数据集,用于支持Covid-19计算机视觉研究。 COVIDX CXR-3由来自至少51个国家 /地区的17,026名患者组成的30,386个CXR图像组成,这使得我们最好,最广泛,最多样化的COVID-19 CXR数据集以开放式访问形式。在这里,我们提供有关拟议数据集的各个方面的全面细节,包括患者人口统计学,影像视图和感染类型。希望Covidx CXR-3可以帮助科学家推进计算机视觉研究,以抵制Covid-19的大流行。
translated by 谷歌翻译